37 research outputs found

    Web Bot detection using mouse movement

    Get PDF
    Non-Legitime traffic in terms of automated internet bot traffic is a long-standing problem causing a huge economic impact and lack of trust in companies and administrations worldwide. For years, Artificial Intelligence and especially Machine Learning have been a key players fighting and helping the stakeholder to analyse and detect fraud instances automatically. However, it does not exist a reliable ground truth public dataset to evaluate and compare the proposed methodologies in the literature. Throughout this thesis, it is developed a public dataset consisting of legitimate and fraudulent web mouse movements extracted from real bot engines. In addition, it is evaluated using two Machine Learning models based on Decisions Tree classifier called LightGBM whilst the second one is based on Recurrent Neural Networks outperforming the accuracyEl tráfico no legítimo en términos de tráfico automatizado de bots de Internet es un problema que se perpetua durante el tiempo. Este tráfico provoca un gran impacto económico y desconfianza en empresas y administraciones en todo el mundo. Durante años, la Inteligencia Artificial y especialmente el Machine Learning han sido un jugador clave para lucha y ayuda a la parte interesada a analizar y detectar instancias de fraude automáticamente. Sin embargo, no existe un conjunto de datos públicos fiables y verídicos para evaluar y comparar las metodologías propuestas en la literatura. A lo largo de esta tesis, se ha desarrolado un conjunto de datos público que consiste en movimientos legítimos y fraudulentos de ratón. Además, se evalúa mediante dos modelos Machine Learning basados en un clasificador Decisions Tree llamado LightGBM y el segundo se basa en Redes Neuronales Recurrentes.El tràfic no legítim en termes de trànsit automatitzat de bots d'Internet és un problema que es perpetua durant el temps. Aquest tràfic provoca un gran impacte econòmic i desconfiança en empreses i administracions en tot el món. Durant anys, la Intel·ligència Artificial i especialment el Machine Learning han estat un jugador clau per a la lluita i l'ajuda a la part interessada a analitzar i detectar instàncies de frau automàticament. Però, no existeix un conjunt de dades públiques fiables i verídiques per a avaluar i comparar les metodologies propostes en la literatura. Alllarg d'aquesta tesi, s'ha desenvolupat un conjunt de dades públics que consisteix en moviments legítims i fraudulents de ratolí. A més, s'avalua mitjançant dos models de Machine Learning basats en un classificador Decisions Tree anomenat LightGBM i el segon es basa en Xarxes Neuronals Recurrents

    Los múltiples escenarios de la brecha digital : perfiles de internautas según la encuesta de usos de tecnologías de la información y la comunicación del año 2010

    Get PDF
    Este trabajo parte de la inquietud de problematizar la multidimensionalidad de la “brecha digital”, específicamente, los tipos de uso de Internet en la población uruguaya. Con tal motivo, se analiza la primer Encuesta de Usos de Tecnologías de la Información y la Comunicación (EUTIC), realizada en el año 2010. En conjunto con la discusión del concepto de la brecha digital entendido tanto en su mera dimensión de acceso a las TIC (“primer nivel”), como en su concepción compleja producto de brechas sociales mayores, se caracteriza tanto hogares como personas usuarias de las TIC (“internautas”), a los efectos de concluir con aquellos factores más relevantes de las desigualdades digitales. Al igual que con una tipología de internautas que permita la diferenciación de usuarios de acuerdo a características socio-económicas, de acceso y tipo de uso en Internet. Entre otras variables relevantes se encuentran el sexo, la edad, el nivel educativo, la clase y los estratos sociales, y las habilidades digitales de los usuarios. Los principales hallazgos permiten sostener que el uso del espacio virtual resulta segmentado de acuerdo a distintos “escenarios” de la brecha digital, en donde se aglutinan características propias de perfiles de internautas, siendo sobre todo la edad y el tipo de acceso determinantes en los tipos de uso en Internet. Por otro lado, se constata que disponer de los implementos TIC necesarios y de las habilidades digitales, serán factores que aumenten la probabilidad de realizar cualquier tipo de uso en Internet. En este sentido, se distinguen cuatro escenarios posibles de “brechas digitales”, junto con cinco perfiles de internautas. Un primer escenario de “política TIC” en donde el tipo de acceso y uso queda determinado por el efecto del Plan Ceibal, el cual impacta fundamentalmente en los “internautas niños” quienes en parte utilizan el laptop XO para estudiar y jugar. Un segundo escenario de “precarización digital”, donde las condiciones de conectividad y socio-económicas de los internautas hacen que estos tercerizen su acceso. Allí se encuentran los usuarios “precarios digitales”, jóvenes y adultos que utilizan las TIC para comunicarse y cuyo contacto con Internet es muy limitado. Un tercer escenario de “inclusión en el acceso”, donde se acceden a las TIC fundamentalmente desde el hogar. Encontraremos en el a los “internautas adultos”, quienes utilizan Internet para “estar al día” (comunicarse, consultar información sobre bienes y servicios, leer noticias). Por último, se reconoce un espacio de “inclusión digital”, de acceso desde múltiples plataformas. Allí se encuentran tanto los “internautas estudiantiles” como “los polifuncionales integrados”, los cuales maximizan su uso en Internet, accediendo desde múltiples lugares a conectividad y utilizando Internet prácticamente para todo. Por lo tanto, existen tipos de uso de Internet diferenciales, o lo que es lo mismo, diferentes niveles de “apropiación” de las TIC, que no hacen más que reforzar la inclusión o exclusión de brechas mayores, que anteceden y guardan correspondencia con la brecha digital, lo cual a la postre retroalimentan las posibilidades de bienestar social de las personas

    Policy in networks, networks in policy. Case study of the campaign #VivirSinMiedo

    Get PDF
    Esta investigación se propuso explorar la campaña de reforma constitucional “Vivir Sin Miedo” como estudio de caso sobre el uso de las redes sociales electrónicas a nivel político en Uruguay. La reforma considera entre otros puntos la creación de una guardia militar y la “cadena perpetua revisable”. El objetivo del trabajo es mostrar cómo los diferentes actores nucleados en torno a la temática captan y se apropian del espacio virtual. Conocer la forma topológica de estas redes y vislumbrar si estas logran despolitizar el tema e impactar en la difusión de su mensaje hacia nuevos adherentes de todos los partidos políticos. O por el contrario, representan una red compacta de actores dentro de un mismo espectro ideológico, que comparten una misma preocupación sin ir más allá de sus preferencias partidarias. Para ello, se colectaron un conjunto de tweets y retweets en torno al hashtag #VivirSinMiedo” para su posterior procesamiento y análisis en grafos. Entre los principales hallazgos se destacan la existencia de una red compacta descentralizada en tres grandes sub-redes, las cuales están conformadas básicamente por los propulsores de la campaña por un lado (núcleo duro de actores políticos vinculados a la reforma). Un cinturón de adherentes partidarios. Y otro cinturón de adherentes no partidarios, con lazos débiles hacia los actores políticos. Pese a existir “brokers” y replicadores de información independientes (periodistas), la red #VivirSinMiedo no hace más que difundir la campaña entre “iguales” (nodos que comparten preferencias políticas), siendo su capacidad de expansión hacia nuevos adherentes muy restringida.This research project aims to explore the campaign for constitutional reform known as “Live Without Fear” as a case study on the use of electronic social networks at a political level in Uruguay. Among other points, the proposed amendment considers the creation of a military guard and the institution of “revisable life imprisonment”. The objective of this piece is to show how the different actors gathered around the theme capture and take ownership of the virtual space. Also to learn about the topological form of these networks and to see if these are able to depoliticize the issue and impact on the dissemination of their message to new adherents from all political parties; or if, on the contrary, they represent a compact network of actors within the same ideological spectrum, who share the same concern without going beyond their party preferences. To do this, a set of tweets and retweets were collected around the hashtag #VivirSinMiedo [#LiveWithoutFear] for further processing and analysis in graphs. The main findings include the existence of a compact network decentralized into three large sub-networks, which are basically made up of the proponents of the campaign on the one hand (hard core of political actors linked to the amendment campaign); a circle of party adherents, on the other hand; and another outer-circle of non-party adherents with weak ties to political actors. Despite the existence of independent “brokers” and replicators of information (journalists), the #VivirSinMiedo network does not do more than spread the campaign among “peers” (nodes that share political preferences), and its ability to expand towards new adherents is very restricted

    El uso de Twitter en la campaña de elecciones nacionales en Uruguay

    Get PDF
    The purpose of this article is to analyze the way in which the different candidates for the 2019 presidential elections in Uruguay used Twitter as a tool for discussion and promotion during the campaign. The aim is to determine whether this platform has an impact on the outreach to new adherents or, otherwise, it aims to be a space of mere digital presence. For the analysis, all the tuits of presidential candidates in the period March-October 2019 were extracted and descriptive processing, multivariate analysis and graph networks were performed. The main findings reveal a precarious use, mostly of self-promotion, and a low interaction between voters and politicians. It also highlights the existence of decentralized networks in blocks that reproduce the party ideological preferences of the offline world and are composed of followers who are, for the most part, supporters. It is concluded that the use of Twitter does nothing more than disseminate political discourse among "peers" ("friends of friends" or militants).El propósito del presente artículo es analizar la manera en que los diferentes candidatos a las elecciones presidenciales de 2019 en Uruguay utilizaron Twitter como herramienta de discusión y promoción en campaña. Se busca determinar si esta plataforma impacta en la difusión hacia nuevos adherentes o, por el contrario, pretende ser un espacio de mera presencia digital. Para el análisis se extrajeron todos los tuits de candidatos a la presidencia en el período marzo-octubre 2019 y se realizó un procesamiento descriptivo, análisis multivariado y redes de grafos. Entre los principales hallazgos se revelan un uso precario, principalmente de autopromoción, y una baja interacción entre electores y políticos. También se destaca la existencia de redes descentralizadas en bloques que reproducen las preferencias ideológicas partidarias del mundo offline y que están conformadas por seguidores que son, en su mayoría, adherentes partidarios. Se concluye que el uso de Twitter no hace más que difundir el discurso político entre “iguales” (“amigos de amigos” o militantes)

    Necessidades legais e conflitos da vida cotidiana. Uma abordagem à análise das desigualdades

    Get PDF
    El presente artículo pretende contribuir al conocimiento sobre los conflictos de la vida cotidiana haciendo un análisis de la Encuesta de Necesidades Legales de Uruguay en el año 2021, mediante la aplicación de técnicas de clúster y análisis de correspondencias múltiples (ACM). El artículo se organiza con un primer apartado donde se revisa la literatura disponible, para luego presentar la metodología, los resultados y las conclusiones. Entre los hallazgos se destaca que las necesidades legales no se distribuyen uniformemente en el espacio social, al tiempo que la gravedad de los problemas afecta en mayor medida a los niveles socioeconómicos más bajos. En contraste, los problemas considerados muy graves aparecen en menor proporción entre personas de estrato medio-alto y alto.This article intends to contribute to the knowledge about the conflicts of daily life by analyzing the Survey of legal needs of Uruguay in the year 2021, through the application of cluster and multiple correspondence analysis (MCA) techniques. The article is organized with a first section where the available literature is reviewed, and then the methodology, results and conclusions are presented. Among the findings, it stands out that legal needs are not evenly distributed in the social space, while the severity of the problems affects the lowest socioeconomic levels to a greater extent. In contrast, problems considered very serious appear to a lesser extent among people from the upper-middle and upper-income strata.Este artigo visa contribuir para o conhecimento sobre os conflitos da vida cotidiana, analisando o Levantamento de necessidades legais do Uruguai no ano de 2021, por meio da aplicação de técnicas de cluster e análise de correspondência múltipla (ACM). O artigo está organizado com uma primeira seção onde é revisada a literatura disponível, e em seguida são presentados a metodologia, resultados e conclusões. Dentre os achados, destaca-se que as necessidades legais não se distribuem uniformemente no espaço social, enquanto a gravidade dos problemas afeta mais os níveis socioeconômicos mais baixos. Em contraste, os problemas considerados muito graves aparecem em menor grau entre as pessoas dos estratos de renda média-alta e alta

    Efficient Keyword Spotting by capturing long-range interactions with Temporal Lambda Networks

    Get PDF
    Models based on attention mechanisms have shown unprecedented speech recognition performance. However, they are computationally expensive and unnecessarily complex for keyword spotting, a task targeted to small-footprint devices. This work explores the application of Lambda networks, an alternative framework for capturing long-range interactions without attention, for the keyword spotting task. We propose a novel \textit{ResNet}-based model by swapping the residual blocks by temporal Lambda layers. Furthermore, the proposed architecture is built upon uni-dimensional temporal convolutions that further reduce its complexity. The presented model does not only reach state-of-the-art accuracies on the Google Speech Commands dataset, but it is 85% and 65% lighter than its Transformer-based (KWT) and convolutional (Res15) counterparts while being up to 100 times faster. To the best of our knowledge, this is the first attempt to explore the Lambda framework within the speech domain and therefore, we unravel further research of new interfaces based on this architecture.Comment: speech recognition, keyword spotting, lambda network

    Desafíos y límites del uso social de internet : una aproximación al caso uruguayo

    Get PDF
    Artículo originalEste artículo analiza la diversificación de los usos sociales de Internet en la vida cotidiana de los uruguayos en los últimos años, a partir del análisis de las prácticas y competencias adquiridas en diversos campos de actividad: social, político y cultural. Se considera que una vez “superados” los principales obstáculos del acceso digital, la desigualdad social se expresa en las competencias adquiridas para usos complejos y estratégicos en Internet. El artículo utiliza parte del relevamiento de campo de una investigación más amplia, denominada Mapping Digital Media - Uruguay, realizada entre 2011 y 2013 por investigadores del Programa de Desarrollo de la Información y la Comunicación (PRODIC) y el Observatorio de Tecnologías de Información y Comunicación (Observa TIC) de la Universidad de la República

    Explorando posibles tipologías de internautas en Uruguay

    Get PDF
    Treball de recerca presentat al seminari de doctorat "Metodología para la construcción de tipologías con técnicas de análisis multivariado" de la Universidad de la República, Facultad de Ciencias SocialesLos grandes esfuerzos en la sociología sobre la Sociedad de la Información (SI) se han dirigido fundamentalmente a explicar cómo usamos y qué tanto nos apropiamos de las Tecnologías de la Información y la Comunicación (TIC), al igual que vislumbrar cuáles han sido sus impactos en la calidad de vida de los hogares y los usuarios. En este artículo se presenta un análisis exploratorio de factores que hacen a la brecha digital y una primera tipología de clasificación de usuarios de Internet según los datos de la Encuesta de Usos de Tecnologías de la Información (EUTIC) para el año 2010. El estudio tiene como objetivo determinar perfiles de internautas de acuerdo a condicionantes estructurales, de acceso, y tipos de usos que realizamos los uruguayos en la red.Els grans esforços en la sociologia sobre la Societat de la Informació (SI) s'han dirigit fonamentalment a explicar com fem servir i què tant ens apropiem de les Tecnologies de la Informació i la Comunicació (TIC), igual que albirar quins han estat els seus impactes en la qualitat de vida de les llars i els usuaris. En aquest article es presenta una anàlisi exploratòria de factors que fan a la bretxa digital i una primera tipologia de classificació d'usuaris d'Internet segons les dades de l'Enquesta d'Usos de Tecnologies de la Informació (EUTIC) per a l'any 2010. L'estudi té com a objectiu determinar perfils d'internautes d'acord a condicionants estructurals, d'accés, i tipus d'usos que realitzem els uruguaians a la xarxa.The great efforts in sociology on the Information Society (IS) were mainly aimed at explaining how we use and how we appropriated of Technologies of Information and Communication (ICT). Also the aim is to glimpse what were their impacts on the quality of life of households and users. This article presents an exploratory analysis of factors that characterize the digital divide and an initial typology for classifying Internet users according to data from Survey of Uses of Information Technology (EUTIC) for 2010. The aim of this study is to determine profiles of Internet users according to the access, the structural constraints, and the types of uses that Uruguayan done in networ

    Efficient keyword spotting by capturing long-range interactions with temporal lambda networks

    Get PDF
    Models based on attention mechanisms have shown unprecedented speech recognition performance. However, they are computationally expensive and unnecessarily complex for keyword spotting, a task targeted to small-footprint devices. This work explores the application of Lambda networks, an alternative framework for capturing long-range interactions without attention, for the keyword spotting task. We propose a novel ResNet-based model by swapping the residual blocks by temporal Lambda layers. Furthermore, the proposed architecture is built upon uni-dimensional temporal convolutions that further reduce its complexity. The presented model does not only reach state-of-the-art accuracies on the Google Speech Commands dataset, but it is 85% and 65% lighter than its Transformer-based (KWT) and convolutional (ResNet15) counterparts while being up to 100× faster. To the best of our knowledge, this is the first attempt to explore the Lambda framework within the speech domain and therefore, we unravel further research of new interfaces based on this architecture.Peer ReviewedPostprint (author's final draft
    corecore